تجزیه و تحلیل داده پیشرفته با PySpark الگوهایی برای یادگیری از داده ها در مقیاس بزرگ با استفاده از پایتون و اسپارک
نویسنده:
آکاش تاندون، سندی رایزا، اوری لیزرسون، شان اوون،جاش ویلز
مترجم:
احسان باقری، پیمان حاجی زاده عنبران، محمدمهدی ذوالفقاری طهرانی،محمد ملکی نیا
سال نشر:
۱۴۰۳
صفحه:
۳۲۴
نوبت چاپ:
۱

مقدمه مترجمین/ ۱۵

پیشگفتار/ ۱۷

چرا اکنون این کتاب را نوشتیم؟ /۱۸

این کتاب چگونه سازماندهی شده است /۱۹

استفاده از نمونه کد /۲۱

قدردانی ها/ ۲۳

فصل ۱: تجزیه و تحلیل داده‎های بزرگ /۲۵

کار با داده‎های بزرگ/ ۲۷

معرفی آپاچی‎اسپارک و پای‎اسپارک /۳۰

اجزاء اسپارک /۳۰

مقایسه با (MapReduce )/۳۱

(PySpark) /۳۲

زیست‎بوم/ ۳۴

اسپارک ۰/۳ ۳۵

پای‎اسپارک به چالش‎های علم داده می‎پردازد/ ۳۶

از اینجا کجا برویم /۳۸

فصل ۲: مقدمه‎ای بر تجزیه و تحلیل داده‎ها با پای‎اسپارک/ ۳۹

(DataFrame) و (RDDs)/۴۱

معماری اسپارک/ ۴۲

در حال نصب پای‎اسپارک/ ۴۴

تنظیم داده های ما /۴۷

تجزیه و تحلیل داده ها با دیتافریم ای‎پی‎ای/ ۵۵

آمار خلاصه سریع برای دیتافریمز /۶۱

چرخش و تغییر شکل دیتافریم/ ۶۳

امتیازدهی و ارزیابی مدل/ ۶۸

از اینجا کجا برویم/ ۷۱

فصل ۳: توصیه موسیقی و مجموعه داده موسیقی (Audioscrobbler )/۷۳

تنظیم داده‎ها ۷۴

الزامات ما برای یک سامانه پیشنهاددهنده/ ۷۷

الگوریتم حداقل مربعات متناوب /۸۱

آماده سازی داده ها /۸۳

ساخت اولین مدل/ ۸۶

توصیه‎های بررسی نقطه ای/ ۹۱

ارزیابی کیفیت توصیه /۹۴

AUC محاسباتی/ ۹۶

انتخاب فراپارامتر/ ۹۸

ارائه توصیه ها /۱۰۲

از اینجا کجا برویم /۱۰۳

فصل ۴: پیش‎بینی با درختان تصمیم و جنگل های تصمیم/ ۱۰۵

درختان و جنگل های تصمیم/ ۱۰۶

آماده‎سازی داده ها /۱۱۱

اولین درخت تصمیم ما /۱۱۶

فراپارامترهای درخت تصمیم /۱۲۵

تنظیم درختان تصمیم/ ۱۲۸

بازبینی ویژگی‎های دسته بندی/ ۱۳۴

جنگل های تصادفی/ ۱۳۸

پیش‎گویی/ ۱۴۱

از اینجا کجا برویم /۱۴۲

فصل ۵: تشخیص ناهنجاری با (K-means Clustering )/۱۴۵

K- به معنای خوشه بندی است/ ۱۴۷

شناسایی ترافیک شبکه غیرعادی/ ۱۴۸

مجموعه داده KDD Cup)( ۱۹۹۹) )  

اولین برداشت در مورد خوشه بندی/ ۱۵۱

انتخاب (k )/۱۵۴

تجسم با(spark R )/۱۵۸

نرمال‎سازی ویژگی ها/ ۱۶۴

متغیرهای طبقه بندی شده/ ۱۶۷

استفاده از برچسب ها با آنتروپی /۱۶۸

خوشه ‎بندی در عمل/ ۱۷۱

از اینجا کجا برویم/ ۱۷۲

فصل ۶: آشنایی با ویکی پدیا با LDA و (SPARK NLP )/۱۷۵

تخصیص دیریکله نهفته/ ۱۷۶

LDA در (pyspark )/۱۷۷

دریافت داده ‎ها/۱۷۸

اسپارک ان آل پی/ ۱۸۰

تنظیم محیط/ ۱۸۱

تجزیه داده ها/ ۱۸۲

آماده‎سازی داده ها با استفاده از اسپارک ان‎ال‎پی /۱۸۴

(TF-IDF )/۱۸۹

محاسبه (TF-IDFs)/۱۹۰ 

ایجاد مدل (LDA )/۱۹۱

از اینجا کجا برویم/ ۱۹۵

فصل ۷: تجزیه و تحلیل داده ‎های مکانی و زمانی در داده های سفر تاکسی /۱۹۷

آماده سازی داده ‎ها/ ۲۰۰

تبدیل رشته های زمان تاریخ به مهر زمانی /۲۰۲

رسیدگی به سوابق نامعتبر/ ۲۰۵

تجزیه و تحلیل جغرافیایی/ ۲۰۷

معرفی ژئوجیسون/ ۲۰۷

ژئوپانداها /۲۰۹

Sessionization در پای‎اسپارک/ ۲۱۳

Building Sessions: Secondary Sorts در پای‎اسپارک /۲۱۴

از اینجا کجا برویم/ ۲۱۸

فصل ۸: تخمین ریسک مالی /۲۲۱

واژه شناسی/ ۲۲۳

روش‎ های محاسبه (VaR )/۲۲۴

واریانس-کوواریانس /۲۲۴

شبیه سازی تاریخی/ ۲۲۴

شبیه سازی مونت‎کارلو/ ۲۲۴

مدل ما/ ۲۲۵

دریافت داده ‎ها/ ۲۲۷

آماده‎سازی داده ها/ ۲۲۸

تعیین وزن عوامل /۲۳۱

نمونه ‎برداری/ ۲۳۶

توزیع نرمال چند متغیره/ ۲۳۸

اجرای آزمایشی/ ۲۳۹

تجسم توزیع بازده /۲۴۴

از اینجا کجا برویم /۲۴۵

فصل ۹: تجزیه و تحلیل داده‎های ژنومیک و پروژه( BDG )/۲۴۷

جداسازی فضای ذخیره سازی از مدل‎سازی/ ۲۴۹

راه اندازی (ADAM )/۲۵۳

مقدمه ‎ای بر کار با داده های ژنومیک با استفاده از (ADAM )/۲۵۴

تبدیل فرمت فایل با (ADAM CLI )/۲۵۵

بلع داده های ژنومیک با استفاده از پای‎اسپارک و آدام /۲۵۶

پیش‎بینی سایت های اتصال فاکتور رونویسی از داده ‎های/ ۲۶۲

از اینجا کجا برویم /۲۶۹

فصل ۱۰: تشخیص شباهت تصویر با یادگیری عمیق و (PySpark LSH)/۲۷۱

(PyTorch )/۲۷۲

نصب و راه اندازی/ ۲۷۳

آماده‎سازی داده‎ ها/۲۷۴

تغییر اندازه تصاویر با استفاده از (PyTorch )/۲۷۵

مدل یادگیری عمیق برای نمایش برداری تصاویر/ ۲۷۶

جاسازی های تصویر/ ۲۷۶

جاسازی‎های تصویر را به پای‎اسپارک وارد کنید/ ۲۷۹

جستجوی شباهت تصویر با استفاده از پای‎اسپارک( LSH )/۲۸۱

جستجوی نزدیکترین همسایه /۲۸۲

از اینجا کجا برویم /۲۸۵

فصل ۱۱: مدیریت یادگیری ماشینی - چرخه حیات با (MLflow )/۲۸۷

چرخه زندگی یادگیری ماشینی /۲۸۸

عدم تکرارپذیری /۲۸۹

استاندارد نبودن مدل ها /۲۸۹

(MLflow)/۲۸۹

ردیابی (MLflow)/۲۹۰

پروژه های (MLflow)/۲۹۰

مدل های  (MLflow )/۲۹۰

رجیستری (MLflow )/۲۹۰

ردیابی آزمایش /۲۹۱

مدیریت و ارائه مدل های (ML )/۲۹۵

درخواست نصب (pip۳ )/۲۹۸

ایجاد و استفاده از پروژه های ام‎ال‎فلاو /۲۹۹

از اینجا کجا برویم/ ۳۰۳

فهرست کلمات /۳۰۵

کولوفون/ ۳۲۳

دسته بندی موضوعی موضوع فرعی
فنی و مهندسی مهندسی كامپيوتر

تمامی حقوق این سایت برای سازمان ترویج مطالعه و نشر جهاد دانشگاهی محفوظ است. نقل مطالب با ذکر منبع بلامانع است.
Copyright ©۲۰۲۵ Iranian Students Booking Agency. All rights reserved